2
Realitas Linier dari Tensor Multi-Dimensi
AI023Lesson 7
00:00

Meskipun kita menggambarkan data sebagai kisi-kisi 2D demi kemudahan matematis, perangkat keras hanya melihat satu aliran byte 1D yang kontinu. Memahami "realitas linier" ini merupakan prasyarat untuk menerapkan pola reduksi berdasarkan baris pola reduksi—seperti mencari nilai maksimum atau jumlah eksponen.

1. Prinsip "Flattening Linier"

Setiap tensor multi-dimensi secara fisik disimpan secara berurutan. Untuk menerapkan $\text{softmax}(x_i) = \frac{e^{x_i}}{\sum_j e^{x_j}}$, kita harus mengidentifikasi segmen linier yang mewakili suatu baris dan melakukan iterasi untuk menghitung nilai maksimum dan jumlahnya.

Logis 2DMemori Fisik 1D

2. Stabilitas Numerik

Mengapa softmax membutuhkan stabilisasi? Nilai input tinggi menyebabkan $e^{x}$ meledak. Kita menstabilkannya dengan: $$\text{exp}(x_i - \text{max}(x))$$ Ini memaksa desainer kernel untuk melakukan reduksi linier dua tahap (maksimum lalu jumlah) sebelum normalisasi akhir.

3. Verifikasi melalui Baris Pendek

Saat mengembangkan kernel Triton, kita menggunakan pengujian hanya pada baris pendek (misalnya, lebar 16) untuk memastikan aritmetika pointer linier kita menangkap setiap elemen dengan benar sebelum ditingkatkan ke beban kerja produksi.

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>